发布数据
购买数据
下载App
登录
首页
/
RLHF(人类反馈强化学习数据集,Reinforcement Learning with Human Feedback)
RLHF(人类反馈强化学习数据集,Reinforcement Learning with Human Feedback)
农
农业政策作物适配能力评估RLHF数据集
本数据集聚焦农业政策适用判断任务,评估模型对作物与政策间匹配关系的理解准确性,助力构建合规、可靠的农业补贴问答AI系统。
15
1
文本
病
病虫害用药建议合法性与残留风险评估RLHF数据集
本数据集围绕农药使用合规与残留风险管控任务,提供高毒禁用农药识别与安全用药推荐的RLHF人类反馈样本,助力农业AI系统安全可靠地输出防治建议。
15
0
文本
智
智能种植决策建议合理性评估RLHF数据集
本数据集专注农业种植建议中的播种时间判断,提供基于地区作物知识的RLHF合理性评分样本,用于优化农技问答系统与农业大模型的实地适配能力。
11
0
文本
智
智能设备多模态语境理解与情景响应适配性评分RLHF数据集
该数据集面向智能设备场景交互,评估系统对“环境语境+用户意图”的响应匹配性,支持多模态智能助手训练与反馈优化。
12
0
文本
金
金融账户行为异常识别与判断逻辑评估RLHF数据集
该数据集聚焦金融账户异常行为识别任务,评估模型在欺诈推断中的逻辑敏感性与风控判断合理性,支持反欺诈AI的风险意识强化训练与合规策略优化。
15
0
文本
投
投资建议平衡性评估RLHF数据集
该数据集聚焦于投资建议的稳健性与风险控制评估,提升AI模型在长短期收益权衡、风险提示与个性化理财建议生成中的策略可信度与合规性。
14
0
文本
政
政策法规解读易懂性优化RLHF数据集
本数据集专注法律与政策条文的通俗解读能力优化,是政务AI助手、法律普及产品等系统构建的重要语言调优资源。
11
0
文本
法
法律问答AI答案中立性与风险提示RLHF数据集
本数据集聚焦法律问答中AI回答的措辞中立性与风险提示质量,支持构建更可信、更安全的法律AI助手。
6
0
文本
小
小学数学试题解析公式表达规范校正RLHF数据集
本数据集聚焦小学数学试题解析中公式表达的规范性判定,用于训练模型识别单位缺失、格式错误等细节问题,提升AI教学生成内容的专业与标准化水平。
12
0
文本
基
基础教育自动答疑纠错反馈RLHF数据集
本数据集面向K12阶段基础教育,聚焦AI自动答疑系统对学生知识误区的识别与反馈能力,支持教学纠错型大模型的训练与优化。
11
0
文本
1
2